Source de données
EDA
Apres le cleaning des données, nous avons opté pour explorer et extraire les tendances des données en question. La figure ci-dessous illustre la matrice de corrélation des données. Les variables sont corrélées tant que la valeur de corrélation entre eux tend vers 1 ou bien -1.
D’une autre part, Les données en question contient des variables qui ne sont pas assez informatives. Nous avons ploté les histogrammes qui correspondent à chacune des variables. Les histogrammes suivants correspondent à des variables qui ne sont pas informatives :
On remarque que la fréquence des valeurs de ces variables se concentre sur un seul intervalle précis, ce qui introduit un aspect de biaise. Par la suite, nous avons plote les différents histogrammes des variables mesuré par les capteurs à différentes profondeurs. Les figures sont illustrées dans la table suivante :
D'une autre part, ci-dessous sont les figures qui illustrent les differents metriques selon la profondeur des capteurs: